# -*- coding: utf-8 -*-
# date:2025
# Author: XIAN
# function: qwen3:1.7b 非流式调用

import ollama

def api_generate(text: str):
    print(f'提问：{text}')

    # 调用 ollama.generate 方法，设置 stream=False
    response = ollama.generate(
        stream=False, # 非流式
        model='qwen3:1.7b',  # 修改大模型名称
        prompt=text,
    )

    print('-----------------------------------------')
    print(response['response'])  # 输出完整的响应内容
    print('-----------------------------------------')
    print('总耗时：{}'.format(response['total_duration']))
    print('-----------------------------------------')

# todo 业务定制化
# ······

api_generate(text='请说下西游记的主要人物，讲述了一个什么故事?')
